Java正则表达式

388次阅读
没有评论

共计 2008 个字符,预计需要花费 6 分钟才能阅读完成。

本地爬虫

  • Pattern:表示正则表达式
  • Matcher:文本匹配器,按照正则表达式的规则去读取字符串,从头开始读取,在大串中去找符合匹配规则的子串
package top.aboss;

import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Hello {public static void main(String[] args) {
        String str = "Java 自从 95 年问世以来,经历了很多版本,目前企业中用的最多的是 Java8 和 Java11," +
                " 因为这两个是长期支持版本,下一个长期支持版本是 Java17,相信在未来不久 Java17 也会逐渐登上历史舞台。";

        // 1. 获取正则表达式对象
        Pattern p = Pattern.compile("Java\\d{0,2}");
        // 2. 获取文本匹配器对象
        Matcher m = p.matcher(str);
        // 3. 利用循环获取
        while (m.find()) {String s = m.group();
            System.out.println(s);
        }
    }
}

网络爬虫

package top.aboss;

import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.URL;
import java.net.URLConnection;
import java.util.regex.Matcher;
import java.util.regex.Pattern;

public class Hello {public static void main(String[] args) throws IOException {
        // 创建 URL 对象
        URL url = new URL("https://www.cnblogs.com/longronglang/p/6429260.html");
        // 连接上这个网址
        URLConnection conn = url.openConnection();
        // 创建对象去读取网络中的数据
        BufferedReader br = new BufferedReader(new InputStreamReader(conn.getInputStream()));

        // 获取正则表达式对象 pattern
        String regex = "[1-9]\\d{17}";
        Pattern pattern = Pattern.compile(regex);// 在读取的时候每次读一整行

        String line;
        while ((line = br.readLine()) != null) {Matcher matcher = pattern.matcher(line);
            while (matcher.find()) {System.out.println(matcher.group());
            }
        }

        br.close();}
}

分组

每组是有组号的,也就是序号。

  • 规则 1:从 1 开始,连续不间断
  • 规则 2:以左括号为基准,最左边的是第一组,其次为第二组,以此类推

捕获分组

就是把这一组的数据捕获出来,再用一次。后续还要继续使用本组的数据,正则内部使用:\\ 组号 ,正则外部使用:$ 组号

package top.aboss;

public class Hello {public static void main(String[] args) {
        // 判断字符串开始和结束是否一致
        // \\ 组号 表示把第 X 组的内容再拿出来用一次
        String reg = "(.+).+\\1";
        System.out.println("a123a".matches(reg));
        System.out.println("abc123abc".matches(reg));

        // 判断字符串开始和结束是否一致,并且开始部分每个字符需要一致
        String reg2 = "((.)\\2*).+\\1";
        System.out.println("aaa123aaa".matches(reg2));

        // 口吃替换
        String reg3 = "(.)\\1+";
        System.out.println(" 我要学学编编编编程程程程程程 ".replaceAll(reg3, "$1"));
    }
}

非捕获分组

分组之后不需要再用本组数据,仅仅是把数据括起来,特点是不占用组号。

package top.aboss;

public class Hello {public static void main(String[] args) {
        // 身份证号码简易正则表达式
        String reg = "[1-9]\\d{16}(?:\\d|X|x)";
        System.out.println("41080119930228457x".matches(reg));
    }
}

(?:) (?=) (?!) 都是非捕获分组,更多的是使用第一个。

正文完
 0
阿伯手记
版权声明:本站原创文章,由 阿伯手记 于2023-10-10发表,共计2008字。
转载说明:本站原创内容,除特殊说明外,均基于 CC BY-NC-SA 4.0 协议发布,转载须注明出处与链接。
评论(没有评论)
验证码

阿伯手记

阿伯手记
阿伯手记
喜欢编程,头发渐稀;成长路上,宝藏满地
文章数
767
评论数
207
阅读量
683423
今日一言
-「
热门文章
职场救急!AI请假话术生成器:1秒定制高通过率理由

职场救急!AI请假话术生成器:1秒定制高通过率理由

超级借口 不好开口?借口交给我!智能生成工作请假、上学请假、饭局爽约、约会拒绝、邀约推辞、万能借口等各种借口理...
夸克网盘快传助手提高非VIP下载速度

夸克网盘快传助手提高非VIP下载速度

夸克网盘限速这个大家都知道,不开会员差不多限速在几百 K。那有没有办法在合法合规途径加速下载夸克网盘呢?这里推...
TVAPP:开源电视盒子资源库,一键打造家庭影院

TVAPP:开源电视盒子资源库,一键打造家庭影院

导语 TVAPP 是一个专为 Android TV 电视盒子用户打造的开源影音资源库,集成了影视、直播、游戏等...
巴别英语:用美剧和TED演讲轻松提升英语听力与口语

巴别英语:用美剧和TED演讲轻松提升英语听力与口语

还在为枯燥的英语学习而烦恼吗?巴别英语通过创新的美剧学习模式,让英语学习变得生动有趣。平台提供海量美剧和 TE...
Chinese Name Generator 在线中文姓名生成器

Chinese Name Generator 在线中文姓名生成器

Chinese Name Generator 是一款在线中文姓名生成器,可在几秒内生成符合个人需求的中文名字。...
2025年12月 每日精选

2025年12月 每日精选

关于每日精选栏目 发现一些不错的资源,点击 这里 快速投稿。 12 月 26 日 .ax 顶级域 目前全球唯一...
123云盘限时福利:登录即送1个月VIP尊享权益!

123云盘限时福利:登录即送1个月VIP尊享权益!

🎁  零成本体验 20T 超大空间与会员加速通道 🎉 活动亮点 登录即送:无需任何复杂操作,登录账号直接领取 ...
最新评论
阿伯手记 阿伯手记 发了:https://aboss.top/moments/1064
吴蛋蛋 吴蛋蛋 快发小年快乐
吴蛋蛋 吴蛋蛋 Ask4Me,这个之前看server酱接入了
15220202929 15220202929 怎么用
八对 八对 麻烦大佬更新下【堆新】的友链站名:八对星星描述:极目星视穹苍无界•足履行者大地有疆链接:https://8dui.com图标:https://cf.8dui.com/logo.webp横标:https://cf.8dui.com/logo-w.webp订阅:https://8dui.com/rss.xml
三毛笔记 三毛笔记 已添加
DUINEW DUINEW 已添加贵站,期待贵站友链~博客名称:堆新博客地址:https://duinew.com/博客描述:堆新堆新,引力向新!——堆新(DUINEW)博客头像:https://d.duinew.com/logo.webp横版头像:https://d.duinew.com/logo-w.webp博客订阅:https://duinew.com/rss.xml
hedp hedp 没看懂
bingo bingo 直接生成就可以啦,也可以添加一些选项
热评文章
夸克网盘快传助手提高非VIP下载速度

夸克网盘快传助手提高非VIP下载速度

夸克网盘限速这个大家都知道,不开会员差不多限速在几百 K。那有没有办法在合法合规途径加速下载夸克网盘呢?这里推...
Short-Link 免费开源短网址程序,基于Fastify、Vercel和Supabase构建

Short-Link 免费开源短网址程序,基于Fastify、Vercel和Supabase构建

Short-Link 是一款基于 Fastify、Vercel 和 Supabase 构建的 URL 缩短服务...
清华大学官方免费DeepSeek教程

清华大学官方免费DeepSeek教程

AI 领域近期最引人注目的焦点当属 DeepSeek,这款由中国创新企业深度求索研发的人工智能工具,正以开放源...
Chinese Name Generator 在线中文姓名生成器

Chinese Name Generator 在线中文姓名生成器

Chinese Name Generator 是一款在线中文姓名生成器,可在几秒内生成符合个人需求的中文名字。...
2026年2月 每日精选

2026年2月 每日精选

关于每日精选栏目 发现一些不错的资源,点击 这里 快速投稿。 2 月 17 日 国家全民健身信息服务平台 过年...
DrawLink:一键生成链接视觉卡片,提升分享点击率

DrawLink:一键生成链接视觉卡片,提升分享点击率

小贴士 :此站或已变迁,但探索不止步。我们已为您备好「类似网站」精选合集,相信其中的发现同样能为您带来惊喜。
WebRTC Screen Mirror:基于浏览器免费开源投屏神器,可实现低延迟、跨平台屏幕共享

WebRTC Screen Mirror:基于浏览器免费开源投屏神器,可实现低延迟、跨平台屏幕共享

WebRTC Screen Mirror 是一款基于 WebRTC 技术的在线屏幕共享工具,它利用浏览器内置的...